MuVAP: Modelo multimodal para predicción de turnos en conversaciones Descubre MuVAP, el modelo que predice quién hablará usando solo audio y una cámara. Ideal para robots sociales. Más preciso que los modelos actuales. 2026-06-16 · 2 min